Una vía rápida para el Big Data
Por: Ron Kasabian, de Intel Corporation y Charles Zedlewski, de Cloudera
Caracas 7 de noviembre de 2014 – Sus datos están tratando de ir a lugares, y cuando lo hagan, descubrirán eficiencias operativas y nuevas fuentes de ingresos que reinventarán los modelos de negocio. Pero en este momento está atrapado en un atasco de tráfico de datos que lo mantiene lejos de alcanzar su destino final.
Ya sea enterrado en algún lugar o en un silo de almacenamiento de datos empresariales, o en el despliegue de un prototipo de Hadoop, los datos ofrecen la oportunidad de proporcionar una nueva y emocionante perspectiva –pero no se puede hacer esto hasta que la infraestructura analítica esté en mejores condiciones para superar la brecha que hay entre los datos y el cómputo. En la actualidad, el problema con las plataformas de análisis es que éstas se basan en gran medida en la tecnología que colocan los datos en silos o los amontonan reuniéndolos en las plataformas computacionales.
El mercado está lleno de plataformas con informaciones fragmentadas, y cada producto sólo resuelve ciertos problemas. Lo que solía ser una ecuación simple: un procesador más rápido gestionará los datos en menos tiempo; o bien, una solución de software de código abierto proporcionará más opciones de personalización. Pero ahora, esta ecuación no se beneficiará sin ambos. Si se utiliza sólo el software Apache Hadoop no se aprovecha la potencia de la plataforma del hardware requerida para análisis profundos, al mismo tiempo en que el hardware por sí sólo no puede determinar estándares y tendencias obtenidos de datos disímiles. Es por eso que Intel y Cloudera llevaron a cabo una asociación para unir el software Hadoop con un hardware avanzado con el fin de crear una plataforma unificada.
En esencia, estamos renovando la carretera de dos carriles en que los grandes volúmenes de datos y los análisis viajan hacia una autopista de ocho carriles completa, permitiendo más conexiones significativas entre los lugares donde los datos residen. El siguiente paso en la evolución de los análisis de datos es la construcción de un sistema que tenga mayores carreteras conectadas a un Hub central de datos. Estas arterias principales tendrán también rutas “rurales” más pequeñas, con radios desde el centro hasta los bordes. Si bien hay cierta centralización en este modelo, también hay una red distribuida para asegurar que todas las rutas estén abiertas y que los datos puedan moverse libremente.
¿Cuál es el beneficio de esta reestructuración? Una perspectiva más profunda y de mayor alcance ofrecido bajo pedido. Echemos un vistazo a la tarea de crear una atención sanitaria personalizada. La salud de un individuo depende de tres tipos de datos: la composición genética; el comportamiento individual, los ejercicios y la dieta; y las relaciones, por ejemplo, la transmisión de enfermedades por proximidad. Para crear una solución de medicina personalizada, habría que hacer coincidir estas cifras y luego unirlas a los datos de estudios clínicos para identificar los métodos de tratamiento efectivos. Se trata de una enorme cantidad de datos para analizar, pero que ofrece la promesa de un mejor diagnóstico, tratamiento y cura.
Con el fin de revisar todos estos datos, es necesario que ambos, los procesadores potentes de análisis de datos genómicos y el software perfeccionado, sean capaces de encontrar correlaciones entre los indicadores de salud individuales de un paciente y los datos más generales agregados de la población en general. En este ejemplo, llegar al destino de una solución personalizada sólo es posible a través de la infraestructura de soluciones de hardware y de software conjunta – lo que equivale a optar por la nueva autopista de ocho carriles que ha sido construida para llevarlo a donde sea más veloz, en lugar de la ruta antigua de dos carriles que ha existido durante décadas.
La colaboración entre Intel y Cloudera creará la infraestructura necesaria para esta nueva autopista de datos. Como las carreteras que conectan ciudades, pueblos y aldeas, el Cloudera Enterprise Data Hub optimizado y la arquitectura Intel conecta la empresa a los radios remotos de sus datos. Así es como tenemos la intención de capacitar a una empresa inteligente.
Acerca de Intel
Intel (NASDAQ: INTC) es líder mundial en innovación. La compañía diseña y desarrolla la tecnología esencial que sirve como base para los dispositivos informáticos en todo el mundo. Como líder en responsabilidad social y sustentabilidad, Intel también produce el primer microprocesador “libre de conflictos” disponible en el mercado. Información adicional sobre Intel se encuentra disponible en http://newsroom.intel.com/community/es_lar y blogs.intel.com, y acerca de los esfuerzos de producción “libre de conflictos” en conflictfree.intel.com
Intel, Intel Core, Intel Atom, Pentium, Celeron, Intel RealSense y el logo de Intel son marcas registradas de Intel Corporation en los Estados Unidos y en otros países.
*Otros nombres y marcas pueden ser propiedad de otros.